from bs4 import BeautifulSoup

html = """
<html>
<head><title>黑马程序员</title></head>
<body>
    <p id="test01">软件测试</p>
    <p id="test02">2020年</p>
    <a href="/api.html">接口测试</ a>
    <a href="/web.html">Web自动化测试</a>
    <a href="/app.html">APP自动化测试</a>
</body>
</html>
"""
soup = BeautifulSoup(html, "html.parser")
# 提取出第一个p的元素对象
ele = soup.p
print(ele)
# 提取出第一个P的id属性的值
ele_first_id = soup.p.get("id")
print(ele_first_id)
# 提取出第一个P的标签的值
ele_first_tag = soup.p.get_text()
print(ele_first_tag)
# 提取出所有的P的元素对象
ele_all_p = soup.find_all("p")
print(ele_all_p)
# 将所有a标签中的href属性值和对应的标签值依次打印
# 提取所有a
ele_all_a = soup.find_all("a")
print(ele_all_a)
for i in ele_all_a:
    print(i.get("href"))